লেখা দেখে ভিডিও তৈরি করবে মেটার কৃত্রিম বুদ্ধিমত্তা

১ অক্টোবর, ২০২২ ২৩:৪৭  
কয়েকটি শব্দের নির্দেশনা থেকে ছবি বানানোর উপায় হিসেবে দিন দিন উন্নত হচ্ছে কৃত্রিম বুদ্ধিমত্তা। এতে সাধারণত ব্যবহৃত হয় ‘ডাল-ই ২’ বা ‘স্টেবল ডিফিউসন’-এর মতো ‘এআই ইমেজ জেনারেটর’। এই বিষয়টিকেই আরও একধাপ এগিয়ে ‘টেক্সট প্রম্পট’ থেকে ভিডিও তৈরি করতে এআই ব্যবহার করছেন মেটা গবেষকরা। ফেইসবুকে এই গবেষণা সম্পর্কে বৃহস্পতিবার পোস্ট করেন মেটা প্রধান মার্ক জাকারবার্গ। তিনি জানিয়েছেন, ‘মেইক-এ-ভিডিও’ প্রযুক্তি কাজে লাগিয়ে প্রাথমিকভাবে ৫ সেকেন্ডের শব্দহীন ভিডিও ক্লিপ তৈরি করা যাবে। শুনতে অবাক লাগলেও এমনই এক প্রযুক্তি তৈরি করেছে ফেসবুকের মূল প্রতিষ্ঠান মেটা। এ প্রযুক্তিকে ‘আশ্চর্যজনক অগ্রগতি’ বলে অভিহিত করেছেন মেটার প্রধান নির্বাহী। তার ভাষায়, ছবির চেয়ে ভিডিও তৈরি বেশি কঠিন, কারণ, সঠিকভাবে প্রতিটি পিক্সেল বের করার পরও সিস্টেমকে অনুমান করতে হয় যে, এগুলো সময়ের সঙ্গে কীভাবে বদলে যাবে। ভবিষ্যতে একটি নমুনা হিসেবে ‘মেইক-এ-ভিডিও’ প্রকল্প শেয়ার করার পরিকল্পনা রয়েছে মেটার। এ বিষয়ে এক ব্লগ বার্তায় মেটা জানিয়েছে, মাত্র কয়েকটি শব্দ বা বাক্য দেখে বিভিন্ন রং এবং প্রাকৃতিক দৃশ্যের সাহায্যে ভিডিও তৈরি করতে পারে মেক এ ভিডিও। ফলে টুলটি কাজে লাগিয়ে নির্মাতারা সহজেই তাদের ভিডিও তৈরি করতে পারবেন। ‘আনসুপারভাইজড লার্নিং’ নামে পরিচিত একটি এআই প্রযুক্তি ব্যবহৃত হয়েছে এতে, যেখানে অ্যালগরিদমগুলো প্যাটার্ন বোঝার জন্য এমন ডেটা যাচাই করে যা লেবেল দিয়ে চিহ্নিত নয়। পাশাপাশি, বাস্তবধর্মী নাড়াচাড়া দেখতে কেমন হয় সেটিও ভিডিও দেখে যাচাইয়ের সুযোগ দেয় এটি। গবেষকদের ভাষ্যমতে, বিশাল ও জনপ্রিয় এআই সিস্টেমগুলো যেখানে লেখা থেকে ছবি বের করছে, সেদিকে তাদের ‘টেক্সট-টু-ইমেজ’ এআই মডেল প্রশিক্ষিত হয়েছে ইন্টারনেট ডেটার মাধ্যমে। এর মানে হচ্ছে, এতে অতিরঞ্জিত সামাজিক পক্ষপাত শিখেছে এটি। আর এই শেখার মধ্যে বিভিন্ন ক্ষতিকর বিষয়ও থাকছে।